查看原文
其他

SiliconCloud上线Qwen2-Math-72B-Instruct:让最强数学模型加速解题

SiliconCloud 硅基流动
2024-09-14
(由SiliconCloud平台模型Flux.1生成)
此前,硅基流动的大模型API服务平台SiliconCloud上线了阿里开源的Qwen2系列的72B、57B以及两款可免费使用的模型7B、1.5B模型
现在,SIliconCloud正式上线阿里通义近期开源的新一代数学模型Qwen2-Math-72B-Instruct,根据相关评测表现,它成为目前最先进的数学专项模型,SiliconCloud上的推理加速版Qwen2-Math-72B-Instruct可以帮助用户更快解题。
一键体验传送门:
https://cloud.siliconflow.cn/playground/chat/17885302562
API文档:
https://docs.siliconflow.cn/reference/chat-completions-3

直观感受下Qwen2-Math-72B-Instruct在SiliconCloud上的生成速度与效果。



与其他各类开源大模型一样,开发者在本地开发部署Qwen2-Math-72B-Instruct模型有一定门槛。现在,SiliconCloud上线Qwen2-Math-72B-Instruct后,免去了开发部署的门槛,开发者可以轻松调用相应的API服务到实际应用中。
更重要的是,SiliconCloud平台对Qwen2-Math-72B-Instruct做了推理加速,输出速度极快、价格极其亲民(Qwen2-Math-72B-Instruct只需¥4.13/1M tokens),支持开发者自由对比体验各类大模型,从而为自己的生成式AI应用选择最佳实践。

Qwen2-Math-72B-Instruct模型评测表现及亮点


Qwen2-Math基于开源模型Qwen2研发, 根据权威测评集MATH的分数,Qwen2-Math-72B-Instruct超越目前主流的闭源和开源模型,包括GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等,以84%的准确率处理了代数、几何、计数与概率、数论等多种数学问题。
此外,在十大测评榜单中,Qwen2-Math-72B-Instruct获得了远超其他开源数学模型的成绩。
注:通义研发团队在greedy和RM@8 的条件下对模型作了测评,表中为每款Qwen2-Math-72B-Instruct模型列出了三个得分结果,分别是第1次回答得分(无下标数字)、8次回答中出现最多次数的答案的得分,8次回答中reward model所选答案的得分。
Qwen2-Math基础模型使用Qwen2大语言模型进行初始化,并在精心设计的数学专用语料库上进行预训练,训练数据包含大规模高质量的数学网络文本、书籍、代码、考试题目,以及由Qwen2模型合成的数学预训练数据。所有预训练和微调数据集都进行了去污染处理。
随后,通义研发团队训练了指令微调版本模型:首先,基于Qwen2-Math-72B训练一个数学专用的奖励模型;接着,将密集的奖励信号与指示模型是否正确回答问题的二元信号结合,用作学习标签,再通过拒绝采样构建监督微调(SFT)数据;最后在SFT模型基础上使用 GRPO 方法优化模型。
Qwen2-Math系列模型目前主要支持英文,他们也将很快推出中英双语版本,多语言版本也在开发中。

Token工厂SiliconCloud

Llama3.1(8B)、Qwen2(7B、1.5B)等免费用


除了Qwen2-Math-72B-Instruct,SiliconCloud已上架包括Qwen2InternLM2.5-20B-ChatBCE、BGESenseVoice-SmallLlama-3.1FLUX.1DeepSeek-V2-ChatDeepSeek-Coder-V2SD3 MediumGLM-4-9B-Chat、InstantID在内的多种开源大语言模型、图片生成模型、代码生成模型、向量与重排序模型以及多模态大模型。
其中,Llama3.1(8B)、Qwen2(7B、1.5B)等多个大模型API免费使用,让开发者与产品经理无需担心研发阶段和大规模推广所带来的算力成本,实现“Token 自由”。
作为集合顶尖大模型的一站式云服务平台,SiliconCloud致力于为开发者提供更快、更便宜、更全面、体验更丝滑的模型API。SiliconCloud支持用户自由切换符合不同应用场景的模型,同时提供开箱即用的大模型推理加速服务,为生成式AI应用带来更高效的用户体验。

SiliconCloud,让超级产品开发者实现“Token自由”

邀请新用户体验SiliconCloud狂送2000万Token/人


邀请越多,Token奖励越多
siliconflow.cn/zh-cn/siliconcloud

扫码加入用户交流群
继续滑动看下一个
硅基流动
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存